Group by,where,having 是数据库查询中最常用的几个关键字。在工作中,时常用到,前面遇到一个问题,一个查询中使用了where ,group by ,having及聚集函数时 ,执行顺序是怎么样的?为了回答这个问题,将这个三个关键字的用法整理一下。

  • Where:数据库中常用的是Where关键字,用于在初始表中筛选查询。如下面这个例子,从user表中查询出userDepartmentId等于2的数据
Select * from dbo.user where userDepartmentId=2
  • Group by:对Select查询出来的数据集按照某个字段或者表达式进行分组,获得一组组的集合,然后从每组中取出一个指定字段或者表达式的值。

我们需要注意的是:在使用Group By的SQL语句中,select中返回的字段,必须满足以下两个条件之一:

  1. 包含在Group By语句的后面,作为分组的依据;
  2. 这些字段包含在聚合函数中。常见的聚会函数有:count,sum,MAX, AVG等

从刚才的那个例子中,我们查询出每个城市,相同年龄的员工数量:

select city, count(*),age from dbo.user where departmentID=2 group by city,age
  • Having:用于对where和group by查询出来的分组经行过滤,查处出满足条件的分组结果。所以Having的使用需要注意以下几点:
  1. Having只能用于Group By(分组统计语句中)
  2. WHERE 是用于在初始表中筛选查询,HAVING用于在WHERE和GROUP BY 结果分组中查询
  3. Having 子句中的每一个元素也必须出现在select列表中
  4. Having语句可以使用聚合函数,而where不使用。

还是刚才的例子,我们进一步整理,查询员工数量大于20的城市和年龄段

select city, count(*),age from dbo.user where departmentID=2 group by city,age having age >40

 

回到本章开头的那个问题:当一个语句中同时含有where、group by  、having及聚集函数时,执行顺序如下:

  1. 执行where子句查找符合条件的数据;
  2. 使用group by 子句对数据进行分组;对group by 子句形成的组运行聚集函数计算每一组的值;
  3. 最后用having 子句去掉不符合条件的组。
  4. having 子句中的每一个元素也必须出现在select列表中。有些数据库例外,如oracle.
  5. having子句和where子句都可以用来设定限制条件以使查询结果满足一定的条件限制。
  6. having子句限制的是组,而不是行。where子句中不能使用聚集函数,而having子句中可以。